Exploration des données de la station El Guardane

Source de données

Nous avons fait la collection des données de la station El Guardane. Les données s'agit des données meteorologiques concernant la zone en question, telles que:

EDA

Apres le cleaning des données, nous avons opté pour explorer et extraire les tendances des données en question. La figure ci-dessous illustre la matrice de corrélation des données. Les variables sont corrélées tant que la valeur de corrélation entre eux tend vers 1 ou bien -1.

correlation matrix

D’une autre part, Les données en question contient des variables qui ne sont pas assez informatives. Nous avons ploté les histogrammes qui correspondent à chacune des variables. Les histogrammes suivants correspondent à des variables qui ne sont pas informatives :

exemple plot 1

On remarque que la fréquence des valeurs de ces variables se concentre sur un seul intervalle précis, ce qui introduit un aspect de biaise. Par la suite, nous avons plote les différents histogrammes des variables mesuré par les capteurs à différentes profondeurs. Les figures sont illustrées dans la table suivante :

exemple plot 1 exemple plot 1

D'une autre part, ci-dessous sont les figures qui illustrent les differents metriques selon la profondeur des capteurs:

exemple plot 1 exemple plot 1 exemple plot 1 exemple plot 1